教授指点计量经济学迷津,useful guidance
欢迎投稿计量经济圈邮箱:
econometrics666@sina.cn
为了更好地促进计量经济圈成员学习因果推断计量方法,我们决定组建“causal effect”文献学习小组。里面主要是通过学习使用因果推断计量方法的经典文献,那让群里每个成员逐渐理解并掌握因果推断计量方法:treatment effects, RD, DID, DDID, Synthetic control等。
因果推断IV方法经典文献,究竟是制度还是人力资本促进了经济的发展?
陈 强
山东大学经济学院教授,博士生导师(数量经济),硕士生导师(数量经济)
泰岳经济研究中心(TREE)副主任(主持工作)
Research Fields
Econometrics, Economic History
问答汇总一
Q1: 坛友jjjlcx:
请问xtrc,betas命令做出的个体最优预测估计是依据哪篇文章
A1:
可以参考最初的论文:
Swamy, P. A. V. B. 1970. Efficient inference in a random coefficient regression model. Econometrica 38: 311-323.
或者从“help xtrc”查看相应的Stata手册
Q2: 坛友condmn:
陈老师您好!两年前就熟读了您的高级计量经济学,想请教您若想系统学习空间计量经济学的stata软件应用应该如何着手,还有就是您觉得除了stata意外,其他计量软件在计量分析中有什么优势,ps,时间序列除外,谢谢!
A2:
首先,要学习空间计量的理论模型。其次,看相关Stata命令的help文件(目前已出现不少空间计量的非官方命令)。最后,选择你要用的空间计量Stata命令,将其提供的案例操作一遍,然后再应用到你的研究中。
Matlab也能做空间计量。Stata是涵盖面最广、最流行的计量软件。Eviews擅长时间序列。R很流行,但其实是统计软件(尽管也有很多计量的包)。还有一些更小众的计量软件,仅解决某些特定的问题,比如William Greene开发的LIMDEP与NLOGIT主要做微观计量。
Q3: 坛友lxpi2008:
陈老师,请教下,对于定序模型,也即oprobit模型,怎么处理内生性问题?
A3:
可用Stata的官方命令gsem来做,参见
http://blog.stata.com/2013/11/07/fitting-ordered-probit-models-with-endogenous-covariates-with-statas-gsem-command/
Q4: 坛友lixinxian:
陈老师你好,我看了你的应用计量经济学的常见问题,非常受益,其中你指出
在面板数据中,感兴趣的变量x 不随时间变化,是否只能进行随机效应的估计(若使用固定效应,则不随时间变化的关键变量 x 会被去掉)?
答:通常还是使用固定效应模型为好(当然,可进行正式的豪斯曼检验,以确定使用固定效应或随机效应模型)。如果使用固定效应,有两种可能的解决方法:
(1)如果使用系统GMM估计动态面板模型,则可以估计不随时间而变的变量x 的系数。
(2)在使用静态的面板固定效应模型时,可引入不随时间而变的变量 x与某个随时间而变的变量 z 之交互项,并以交互项 xz (随时间而变)作为关键解释变量。
你能不能说出这样处理的相关文章?谢谢!
A4:
1、系统GMM的文章很多。比如,创始人的论文:
Blundell, R. and S. Bond, 1998. “Initial Conditions and Moment Restrictions in Dynamic Panel Data Models,” Journal of Econometrics, 87, 115-143.
在应用方面,比如Acemoglu et al (2008) 使用差分GMM估计跨国面板数据,发现人均收入(per capita income)对民主(democracy)的作用不显著。然而,Che et al (2013)使用系统GMM估计同样的数据集,却发现人均收入对民主有显著的正作用。Che et al (2013)认为差分GMM存在弱工具变量问题,而系统GMM比差分GMM更有效率。
Acemoglu, D., S. Johnson, and J. Robinson, and P. Yared, 2008. “Income and Democracy,” American Economic Review, 98, 808-842.
Che, Y., Y. Lu, Z. Tao, and P. Wang, 2013, “The Impact of Income on Democracy Revisited,” Journal of Comparative Economics, 41, 159-169.
2、简单地以x对y的因果作用作为实证论文的卖点可能已经不稀奇了,故有些论文开始以交互项,比如xz,作为主要解释变量。 例如,一般认为干旱会提高农民起义的概率,而Jia (2014)则研究了美洲抗旱作物土豆的引入,使得此效应得以缓解,其核心解释变量就是 (旱灾 x 土豆引种),尽管此文未使用动态面板。
Jia, R. (2014). Weather Shocks, Sweet Potatoes and Peasant Revolts in Historical China, Economic Journal, 124, 92-118.
Q5: 坛友南大南财南师大:
陈老师,您好!我想请问您动态面板数据模型中如何确定前定变量,内生变量和外生变量?谢谢
A5:
通常是从定义与经济理论或常识出发,来确定前定、内生与外生变量。比如,你可以先假定全部变量都是外生变量,然后考察哪些变量可能内生,例如存在双向因果关系、与遗漏变量相关等。
前定变量与当期扰动项不相关,但可能与其他期扰动项相关。如果你不确定什么变量为前定,也可以不设。当然,还可以做稳健性检验,比较不同模型设定的估计结果。
Q6: 坛友龙族D王小狼:
我想问一下,陈老师,你对ARFIMA (fractional integration)这个模型怎么看?我觉得理论框架很好,但为啥用的人不多呢,学术圈用的也不是很多。
A6:
ARFIMA (fractional integration)模型适用于平稳的long memory process。已被提出三十多年了,但实践中用得少,或许因为经济变量中的long memory process比较少见。
另外,ARFIMA可视为ARMA的推广;因为long memory process也可以用简单的ARMA模型来估计,只是不如ARFIMA更有效率。
事实上,单变量的ARMA模型也用得不多(除用于预测外),因为学术研究更关注x对y的因果作用之类的问题。
Q7: 坛友天堂之路:
请教一下,如何计算动态面板模型的随机投资效率?
A7:
据我所知,一般不用动态面板来做Stochastic Frontier Analysis。这是因为,随机前沿分析本质上是用于分析投入与产出的关系(比如,估计生产函数或成本函数)。上期产量尽管可能与本期产量有统计上的相关性,但上期产量并非用来生产本期产量的投入,故一般不把上期产量放在回归方程的右边,因此不是动态面板。
Q8: 坛友wocaishiliuking:
现在空间计量经济学发展很快,应用也越来越广泛。看了一些教材后,发现教材都在强调传统计量的各种不足,因为经济变量在空间上会相互作用。请教陈老师,传统计量是不是真的就没有出路了啊??
A8:
传统计量与空间计量的区别之一是研究目的不同。传统计量也能处理空间自相关(比如,面板数据允许存在截面相关),但更多地将空间自相关作为一种nuisance,而试图得到在存在截面相关情况下依然稳健的估计量与检验方法。另一方面,当空间计量方法应用于urban, regional与geographic等领域时,空间自相关本身就是主要感兴趣的参数。
传统计量与空间计量的区别之二是在稳健性与有效性之间的抉择。传统计量未假设空间权重矩阵(spatial weighting matrix),故更为稳健。另一方面,空间计量设定了空间权重矩阵,如果此设定正确,则估计会更有效率;但如果空间权重矩阵设定错误,则可能更糟糕。
事实上,许多主流的计量经济学家目前仍不太认可空间计量,主要原因就是空间权重矩阵的主观性与随意性,并非用样本数据估计得到。这是空间计量目前的软肋,也是前沿学者正在努力的方向。
Q9: 坛友hustchen2012:
陈老师您好,对于上市公司的研究来说,很多的事件的发生并不是同时的,这种情形如何去做样本的匹配,从而设计双重查分的识别策略呢?
A9:
可以试试把不同公司的处理效应发生时间都标准化为零。
Q10: 坛友zhang1969:
陈老师您好!如何得出空间面板Moran'I指数?在stata中有相应命令吗
A10:
你搜搜吧,但一般都不汇报。原因很简单,Moran's I 指数为一个变量与其空间滞后(邻居)之间的相关系数,在一定意义上相当于线性相关系数;而在估计一般的面板模型时,通常并不汇报线性相关系数。
更一般地,绝大多数实证论文,都直接进行回归分析,而不提供相关系数;因为相关系数所包含的信息太少。
Q11: 坛友wkd1991:
陈老师,您好!很多文章在做GARCH模型时,均值方程都假设为AR(1),这有什么理论依据?stata可以对序列进行长记忆检验吗?谢谢陈老师。
A11:
如果你不放心,可以引入AR(2)项,如果不显著,则可去掉;如果显著,则保留AR(2),进一步检验AR(3)是否显著。
更正式的选择滞后方法为由大到小(general to specific)的方法,即设一个可能的最大滞后阶数,然后逐步检验最后一阶滞后项的显著性,如不显著则去掉最后一项,直到最后一阶滞后项显著为止。
Q12: 坛友HQWYNHT:
陈老师您好,我想请问,在您看来在跨境电商与地区贸易增长的相关性上,哪种计量模型是最适合的?尤其是在两个领域的互动方面?谢谢
A12:
这取决于你有什么样的数据。最好是面板数据,这样比较有说服力。其次,要注意克服内生性,因为显然存在双向因果关系。建议你先看看文献中是如何建模及使用何种计量方法,然后再考虑你可能的创新是什么。
Q13: 坛友bofeng:
陈老师您好,请教一下,排序选择模型的结果,汇报边际影响的stata命令是什么呢?
A13:
运行ologit或oprobit命令后,使用命令margins应该就行,详见
help ologit_postestimation##margins
Q14: 坛友1836359094:
陈老师您好!我想请问下如何利用stata软件实现使用公司层面的固定效应模型控制同时影响公司治理和投资的潜在因素?
A14:
有关“控制同时影响公司治理和投资的潜在因素”,建议你参考有关公司治理的相关文献。
用Stata实现公司层面的固定效应模型,最常见是双向固定效应模型。比如对于年度面板,可使用如下Stata命令:
xtreg y x1 x2 x3 i.year,fe r
其中,i.year为年度虚拟变量(时间固定效应),选择项fe表示个体(公司)固定效应,选择项r表示聚类稳健标准误。
当然,取决于你的研究问题,也可以考虑使用动态面板模型或非线性面板。
更详细介绍,参见我的教材《高级计量经济学及Stata应用》,高教社,第二版,2014年,第15-17章。
问答汇总二
Q1: 坛友cqyy6356:
陈老师好,现在量化历史研究蛮流行,但一些历史系的老师好像很看不起这种研究方法,觉得是小技无关宏旨,陈老师怎么看待量化历史研究?做量化历史研究的不少是经济学者,对古文文献的掌握相对不足,而历史学者通常计量知识不足,如果要进行量化历史研究如何克服先天的知识缺陷?
A1:
1、传统史学为描述性的,无法揭示大历史的因果规律,而这正是量化历史的长处。
2、需要补足各自的短板,或者开展有效的跨界合作。需要懂计量的历史学者,或者懂历史的经济学家。
Q2: 坛友巢州子:
陈老师,您好!有一个问题想请教您:最近几年国内流行倍差法(DID),那么,倍差法模型到底怎么样设定才能区别于单纯的虚拟变量回归呢?有没有什么巧妙的方法能快速检验一篇文章的倍差法模型是否设定合理?谢谢您!
A2:
1、倍差法的原始含义是做两次差分,但在实践中,通过引入虚拟变量(实验组虚拟变量、实验期虚拟变量,以及它们的交互项)更为方便。
2、DID模型的最主要前提是实验组虚拟变量(treatment variable)不能是内生的。如果个体进入实验组或控制组可以自我选择,则DID依然会有偏差。
Q3: 坛友leon1980:
陈老师好:关于倾向值分析,对结果变量(y)是连续的还是分类的有要求吗?倾向值分析,处理变量(D)是“是否使用互联网”,结果变量(y)是“是否参与过基层选举投票”,结果变量是二分变量,请问倾向值分析的结果变量能否是分类变量。您的书讲的关于收入的例子,收入是连续型变量,结果变量是否可以是分类变量?期待陈老师的解答,祝您工作顺利!
A3:
原则上,PSM的结果变量也可以是离散的。
Q4: 坛友jmszls:
请问计量的量化研究 是否基于逻辑研究判定的基础上,而逻辑判定,又是基于具体孤例的统计以及重复历史的经验判断为基础,那么计量经济学作为独立存在是否没必要。
经济史的经验分析,实物判断是具体孤例,还是非常依赖 统计数据的量化,还是历史就非常依赖,统计数据,来做事。 那经济史独立有什么意义。
结合两者,只有当下才有意义
A4:
任何计量的实证研究都需要一定的理论基础,即至少存在一种X影响Y的可能的合理机制。但此机制究竟是否存在,以及效应究竟有多大,就需要通过计量经济学用统计推断的方法来揭示。孤例可以带来灵感与启发,但样本容量为1,就无法进行从样本到总体的严格统计推断了。
Q5: 坛友longzx:
陈老师好,看到您的研究方向是经济学史,请问在目前的研究中,是否真的存在所谓的经济周期,即繁荣和衰退的周期,如果有的话,经济周期是否有一个比较确定的时间呢,对于一名经济学学生来说的话,想对经济周期进行研究,应该从那些方向开始着手呢?
A5:
一般来说,经济周期的具体时间是不确定的,因为本质上人的行为是随机的。但在某些情况下,经济周期长度比较确定;比如,每四年一次美国总统大选所带来的政治经济周期(political business cycle)。
研究经济周期,就基本上等于研究整个宏观经济,这是非常大的题目啊……个人觉得挑战性与风险都很大。
Q6: 坛友很大的小:
陈老师好,很多实证论文报告回归结果时,只给出T检验结果、R的平方,还有观测值。这些就够了吗?为什么呢?谢谢!
A6:
对于OLS回归,一般汇报回归系数、t统计量(或稳健标准误)、样本容量、R2等就基本够了,因为已经足够进行常规的统计推断了。但如果用其他计量方法,则可能还要汇报其他的统计量或检验结果。比如,使用工具变量法,则一般需要汇报弱工具变量检验(第一阶段回归的F统计量)与过度识别检验(如果过度识别)。
Q7: 坛友huanghuiqun:
陈老师,您好!有一个问题想请教您:计量经济中的研究方法如何结合计算机科学中的计算智能方法在经济科学中进行研究,请您举例说明?谢谢您
A7:
我推荐你看谷歌首席经济学家Hal R. Varian, 2014, "Big Data: New Tricks for Econometrics," Journal of Economic Perspective, 28(2), 3-28.
Q8: 坛友cindycy200:
陈老师,您好!
1、引力模型在国际贸易中运用较为广泛,被解释变量为贸易流量,解释变量为两国的GDP、距离、是否接壤、是否有共同语言、是否签订自由贸易协定等。在面板数据中,通常会比较pols,FE,RE的估计结果,并通过检验决定采用哪一种模型。但在固定效应模型中,像距离、是否接壤、是否有共同语言、是否签订自由贸易协定等是不随时间而改变的量,这些在固定效应模型中应该是估计不出来的。为什么我看到的一些文章关于这些变量都估计出系数呢?
2、如果检验表明文章是采用固定效应模型,像距离、是否接壤、是否有共同语言、是否签订自由贸易协定前面的系数是估计不出来的,那最终的回归结果不是损失了很多信息么?
A8:
1、一种可能的处理方法是,找出这些不随时间而变的因素(比如,距离d)起作用的渠道(比如,x(t),随时间而变),然后使用二者的互动项 d*x(t)得到time-varying variable。另外,如果使用动态面板进行系统GMM估计,则也可以估计time-invariant variable的系数。
2、固定效应模型的缺点是不能估计time-invariant variable的作用系数,但其优点是可在相当程度上克服遗漏两遍了偏差。如果使用混合回归或随机效应模型,则可能得到不一致的估计;那么,即使估计出不随时间而变的变量系数,又有什么意义呢?
Q9: 坛友江流尚可:
陈老师,您好!在模型构建中有个关键问题,就是如何解决内生性问题。一般的做法是引入IV工具变量,使用2SLS估计,这样的做法很普遍,但是工具变量的选择却很困难,请问在目前计量经济学前沿中还有没有处理内生性问题的方法值得借鉴呢?还有就是在处理面板数据模型的时候,利用IV工具变量法需要注意哪些细节?还有就是估计比如Hamilton的面板门槛这类模型时如何处理内生性问题呢?问题比较多,期待您的解答!
A9:
1、处理内生性的其他计量方法包括:面板数据(可克服不随时间而变的遗漏变量偏差)、倾向得分匹配(Propensity Score Matching),断点回归(Regression Discontinuity Design),随机实验与自然实验等。
2、Panel IV的注意细节与横截面IV的差不多。
3、你看看 Caner, Mehmet and Bruce Hansen, 2004, "Instrumental Variable Estimation of a Threshold Model," Econometric Theory, 20, 813-843.
Q10: 坛友C木西:
老师,看您的高级计量教材受益匪浅。祝您生活愉快。我的问题是,应该怎样分配时间经典文献和前沿文献上?每个领域的经典文献不仅多,且牵涉面广,需要耗费大量时间。但是如果从问题出发,受问题引导去做研究可能更需要关注前沿一点的文献。一定程度上说,对于研究生,是做好学术(长远)和快速发paper(短期)存在一定的取舍。所以在这方面可能有些疑惑。谢谢老师。
A10:
打基础阶段,多看经典文献。做研究时,应跟紧前沿文献。基本上,需要什么就读什么,follow your heart,阅读你当下最感兴趣的文章,效果更好。
Q11: 坛友lonhg:
陈老师,您好!有一个问题想请教您:大数据对于企业而言的具体应用,企业在大数据这块自建大数据部门还是购买大数据服务,哪一个更好?谢谢
A11:
有不少大数据的畅销书可看啊。小企业一般应购买大数据服务;而当企业规模达到一定程度后,可考虑自建大数据部门。
Q12: 坛友shixingle:
老师,您好!倾向得分匹配后,如何用STATA做敏感性分析?求助!
A12:
可比较不同匹配方法的结果差异,具体参见我的教材《高级计量经济学及Stata应用》第二版。
另外,推荐使用Stata 13的官方命令“teffects psmatch”,该命令能提供正确的标准误;而非官方命令psmatch2的标准误不正确。
Q13: 坛友lyt639:
陈老师您好,截面数据样本较少检验异方差用什么最好?扩展线性支出系统模型,只有五个样本囧~这种情况是不是R值都是略微低的,不过都在0.8以上
A13:
样本容量 n = 5,就没法做回归啦。R2不说明问题,如果这5个点都在一个直线上,则R2=1。
在当代计量实践中,一般不检验异方差,而直接使用(异方差)稳健标准误。
Q14: 坛友crossbone254:
陈老师,您好,请问空间计量中的空间权重矩阵能如果希望是动态的是否可以估计与做原来相关的计量检验,如果可以,还望您指出相关的参考文献
A14:
这是空间计量的前沿问题。建议你关注空间计量权威Ohio State University李龙飞教授(Lung-fei Lee)的研究:https://economics.osu.edu/people/lee.1777
Q15: 坛友lyl335759155:
陈老师,您好,目前比较前沿的、跟经济学相关的计量方法有哪些?
A15:
前沿的计量方法很多,学无止境,我会在高级计量教材第三版再加入一些前沿的章节。另外,推荐洪永淼老师的最新文章《计量经济学的最新发展》,载于“中科院JCR期刊分区”微信公众号2016年4月11日。
Q16: 坛友繁清:
陈老师,您好!有一个问题想请教您:计量分析的结果不一定就代表因果关系,我们在做实证研究时应该先找到理论基础还是先做出结果再去寻找理论基础?有时候做出结果会很费力,有时却比较轻松。
A16:
两者都可以,看哪种更方便。如果目标是检验某个理论,则应此理论出发,寻找合适的数据集。反之,如果已经拥有某个独特的数据资源,则自然会考虑用这些数据可以做什么实证研究。
Q17: 坛友达岸各自归:
陈老师,您好!我是山大经院在读学生。早就听说您的计量水平很厉害。最近在做一篇小论文。研究国内近十年来劳动收入份额和资本收入份额的变动和影响。但有些困惑想咨询您一下。如果说将劳动收入份额和资本收入份额测算完成以后能否用二者来研究对于国内需求或者收入差距的影响,查阅参考文献时发现很少有这方面的研究?如果可以研究,能建立计量模型吗?该怎么建比较好,还需要考虑哪些变量呢?希望老师能答疑解惑!
A17:
文献中很少涉及,正是你做贡献的时候啊。当然可以建立计量模型,但你还需要其他控制变量,并解决劳动收入份额可能存在的内生性问题(双向因果关系?),比如寻找合适的工具变量。另外,如果可能,建议构建省际面板(因为全国层面的时间序列通常缺乏说服力)。
Q18: 坛友我不吃烤肉:
陈强老师,您好。现在量化经济史比较受欢迎,有很多人做这方面的研究,您觉得前景怎么样
A18:
量化历史前景看好啊。随着越来越多的历史数据被挖掘整理出来,这些历史数据可以用来解释很多有趣的社会经济现象。白营与贾瑞雪老师已经把中国经济史的故事发到顶级期刊Econometrica上啦。
另外,建议关注陈志武教授今年7月主办的北大量化历史讲习班与年会(http://econ.pku.edu.cn/displaynews.php?id=100463)。
Q19: 坛友condmn:
陈老师,您好!作为你高级计量经济学的忠实读者。有一个问题想请教您:您是如何系统学习stata编程的,我想自己有一天编程解决自己的现实问题,谢谢!
A19:
推荐Christopher Baum, 2016, An Introduction to Stata Programming, Second Edition.
参见:http://www.stata-press.com/books/introduction-stata-programming/
Q20: 坛友bofeng:
陈老师您好,想深入学习一下非平衡面板模型,您有什么推荐的书籍和文献吗?谢谢。
A20:
大多数情况下,非平衡面板的处理与平衡面板没有太大差别,Stata命令也一样。一般的高级计量教材都有介绍非平衡面板,但通常只是一小节内容。
非平衡面板可能存在的最大问题是Seletion Bias,即面板数据之所以变为非平衡的原因可能具有内生性,比如个体为何选择退出样本。
Q21: 坛友南大南财南师大:
陈老师,您好,请问超越对数成本函数如何用stata来做?stata的代码是什么呢?非常感谢陈老师!
A21:
Translog cost function的名字唬人,但就是OLS回归啊。参见Greene's Econometric Analysis,对此介绍较多,也有具体例子。
Q22: 坛友南大南财南师大:
陈老师,您好!请问计量模型当中非平衡面板数据模型的stata代码和平衡面板数据模型的stata代码是一样的吗?二者有什么区别吗?
A22:
对互动项的解释主要通过偏导数来进行。
y = a0 + a1*x1 + a2*x2 + a3*x1*x2 + u
忽略扰动项u,则
dy/dx1 = a1 + a3* x2
Q23: 坛友南大南财南师大:
陈老师,请问在做是该用固定效应面板数据模型还是混合面板数据模型的F检验中,如果P值大于0.05,说明应该使用混合面板数据模型进行实证分析,但是我看您高级计量模型当中混合面板数据模型的stata代码还是看不懂,后面要输入vce(cluster id),id用来确定每个个体的变量,您在书中使用state作为id,那我想问陈老师,在做混合面板数据模型回归的时候如何选择id?并且混合数据模型回归被经常使用吗?
A23:
1、面板数据一般为聚类数据(同一个体不同期的扰动项通常存在自相关),故应使用聚类稳健标准误(cluster-robust standard errors),这通过Stata选择项vce(cluster id)来实现。其中,id为表示横截面单位的那个变量。具体到我教材中的例子,由于是美国的州际面板(横截面为美国各州,时间为年度),以变量state表示美国各州,故具体化为vce(cluster state)。
2、面板数据的混合回归方法不常用,因为通常存在个体效应(可表现为个体随机效应,或个体固定效应)。
也可参考我去年出版的本科教材《计量经济学及Stata应用》,对于面板数据的介绍更为简单通俗。
Q24: 坛友ssp000:
陈老师,您好!有个问题请教您:非平衡面板数据OLS回归,控制年度效应后,自变量符号由负变为正,pearson相关性分析与没有控制年度效应一样为负,这大概是什么原因造成的?该怎么处理?谢谢了
Q24:
Pearson相关系数仅考察变量间的两两线性相关关系,而多个变量间的关系可能错综复杂,故Pearson相关系数只是初步考察,信息量不大。
可能原来遗漏了年度效应,导致不一致的估计,故加入年度效应后,自变量的符号改变。在理论上,只要年度效应是显著的,就应该加入年度效应(年度虚拟变量或时间趋势项)。在实践上,加入时间效应后,通常解释变量会变得更不显著,因为时间可以解释很多东西。
Q25: 坛友moretc:
陈老师好,DID模型的适用条件是什么?(在什么情况下可以用),感觉好多人在乱套模型
A25:
最主要的条件是treatment variable(实验分组变量)不能是内生变量。如果存在内生分组的情形,则DID不一致。
Q26: 坛友moretc:
陈老师好,面板模型中检验混合回归模型和固定效应模型的F检验,是根据F检验的公式手动计算,还是stata回归结果里面直接提供了F值及对应的P值?
A26:
都可以。但Stata只在使用普通标准误的情况下,才提供此F统计量及检验结果。因此,推荐使用LSDV法,即加入个体虚拟变量,然后使用聚类稳健标准误,检验这些个体虚拟变量的联合显著性。如果显著,则应使用固定效应模型;反之,可采用面板混合回归。
Q27: 坛友llh2011:
陈老师您好!我想咨询一下,在做计量模型时,如何比较两个回归模型中同一个解释变量估计系数大小的差异?
A27:
不同计量模型中的同一变量系数肯定会有不同。关键要看此计量模型的估计是否一致。如果两个模型都是一致的,则二者回归系数的差别应在大样本下消失。反之,如果一个模型一致,而另一模型不一致,则二者的差异将始终存在。
Q28: 坛友玄一无相:
陈老师你好,您的高级计量经济学教材2版我都有拜读,非常钦佩。关于其中倾向值匹配的方法篇,ATT和ATE的结果呈现选择部分,分别对应处理组和平均处理效应,不过我看不同的文章在研究相同问题时选择呈现不同的结果,请问有更合理的判断依据吗(因为我发现其实两者结果有时候相差挺大,符号神装都是相反的),或者说文中应该充分披露两份数据作为对比?不甚感激
A28:
选择汇报ATT或ATE,或同时汇报,主要看研究者的研究兴趣。在实践中,ATT更为重要些,因为它评估的是实际参加项目组的平均效应。当然,也不排除个别作者为了论文发表而选择仅汇报更为显著的那个平均效应。
Q29: 坛友economic2016:
陈老师您好,我是山大经院的本科生,想请教您:面板数据建模时怎么用stata操作来判断是变截距、变系数还是混合回归模型呢?或者您能否推荐一本有相关内容的书?望回复,谢谢您!
A29:
看我的教材《高级计量经济学及Stata应用》第二版吧。
Q30: 坛友freecit:
您好,陈老师。我是一名农林经济管理专业的大三学生。我发现身边的老师和同学在实证分析上大都是流于形式(不弄个模型,发不了好刊物),老师们做研究需要发放问卷,就委托本地的同学发放、回收。同学们也大都不认真,在宿舍就随便填填,交回去,领劳务费。对于这种情况,老师就当不知道,用这种数据做实证分析,写文章,照样发到CSSCI,当然老师也去实地调研,知道实际情况,所以文章本身是不错的。但是模型对于这篇文章来说,实际上是可有可无的,更多的是流于形式。陈老师如何看待这种现象,如何避免呢?
A30:
如果数据不是随机抽样得来的,填写问卷时也没有质量控制,则用这种数据进行计量分析,所得结果肯定会有偏差,结论也不可靠(Garbage in, garbage out)。之所以出现这种情况,是因为真正严格的随机抽样通常是成本很高的。在这方面,西南财大的中国家庭金融调查,正是因为严格遵循了随机抽样的科学原理,才迅速崛起,广为认可,是我们进行抽样调查调查的楷模。
最后
陈强老师,您好。最近正在拜读您的高级计量经济学一书,感觉受益匪浅,能否请教一下陈老师,如果想更深一步的学习计量,在读完您的高级计量经济学之后应该学习那些教材。
A9:
下面是我在山大上研究生计量时给学生们开的参考书:
1. Hayashi, F., 2000, Econometrics, Princeton University Press.
2. Wooldridge, J., 2010, Econometric Analysis of Cross Section and Panel Data, 2nd ed., MIT Press.
3. Greene, W., 2012, Econometric Analysis, 7th ed., Pearson Education.
4. Stock, J. & M. Watson, 2010, Introduction to Econometrics, 3rd ed., Addison-Wesley.
5. Kennedy, P., 2003, A Guide to Econometrics, MIT Press.
6. Baum, C., 2006, An Introduction to Modern Econometrics Using Stata, StataCorp LP.
7. Cameron A. and K. Trivedi, 2005, Microeconometrics: Methods and Applications, Cambridge.
8. Cameron A. and K. Trivedi, 2010, Microeconometrics using Stata, revised edition, Stata Press.
对我个人而言,在计量理论方面受益最大的是Hayashi的书。Greene的书在理论方面比较混杂,但内容全面,适合作为工具书(需要时,搜索相应内容即可)。如果你想做理论计量,则需要看更深、更偏向证明的书,比如White的书,计量经济学手册等。而大量的前沿成果显然存在于论文中(书籍更新速度太慢)。
写在后面:各位圈友,咱们的计量经济圈社群里面资料和计量咨询都很多,希望大家能够积极加入咱们这个大家庭(戳这里)。之后我们会逐步邀请社群里的圈友再直接建立微信群与圈圈对话,进去之后一定要看“群公告”,不然接收不了群信息。
提议
欢迎各位投稿给计量经济圈,各种文献笔记、计量技巧和最新发现都可以实名在这里发出来,让你在这个圈子积累声誉和将来的合作文章合作机会。